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人 们 的 判断 和 决策 总 是 在 某 种 评估 模式 下 作 
出 的 。 现 实 状 况 和 决策 研究 都 表明 ， 人 们 有 两 种 基 
本 的 评估 模式 : 联合 评估 (joint evaluation, JE) 和 单 
独 评估 (separate or single evaluation, SE)。 在 联合 评 
佑 模式 下 , 决策 者 同时 面 对 两 个 或 两 个 以 上 的 选项 ; 
而 在 单独 评估 的 模式 下 ,决策 者 只 面 对 一 个 单独 选 
项 (Hsee, 1996)。 当 然 , 单独 评估 和 联合 评估 如 同一 
个 连续 光谱 的 两 端 ， 现 实生 活 中 ， 人 们 有 时 会 处 于 
两 种 评估 模式 的 中 间 地 带 。 例如: 为 了 决定 报考 志 
愿 , 一 位 高 中 生 参 观 了 几 所 大 学 校园 。 如 果 是 数 天 
之 内 密集 地 参观 多 所 学 校 , 那么 他 /她 的 评估 模式 
就 更 接近 联合 评估 。 如 果 是 隔 几 周 或 几 个 月 才 参 观 
一 所 , 那么 他 /她 的 评估 模式 就 更 接近 单独 评 佑 ， 
因为 相 较 于 当下 的 生动 场景 , 许久 前 参观 所 获取 的 
言 息 已 经 变 得 比较 模糊 不 清 。 

单独 评估 和 联合 评估 对 于 人 们 的 决策 过 程 和 
结果 有 着 深刻 影响 ， 最 为 经 典 就 是 评估 模式 导致 的 
偏好 反 转 现象 (Hsee, 1998; Kahneman & Ritov, 1994; 
Kogut & Ritov, 2005; List, 2002)。 请 想象 你 是 一 位 
音乐 学 院 的 学 生 , 需要 购买 一 本 音乐 类 词典 。 词 典 
A 封面 完好 ， 内 含 1 万 词 条 ; 词典 B 封面 破损 , 但 
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人 们 有 两 种 基本 的 评估 模式 : 一 是 联合 评 佑 ， 即 所 有 选项 一 起 呈现 和 被 评估 ; 二 是 单独 评估 ,各 个 选项 单 
独 地 呈现 和 被 评估 。 所 有 决策 都 是 在 其 中 一 种 评估 模式 或 者 两 种 模式 的 中 间 寺 
能 帮助 人 们 提高 决策 结果 , BLASS 
平 佑 模式 产生 了 不 少 反 直觉 的 效应 ， 目 


带 中 做 出 的 。 联 合 和 单独 评估 可 以 
定价 、 消 费 、 甚 至 幸福 感 等 方面 。 作 


前 研究 尚 不 全 面 ， 是 一 块 值得 探索 的 


好 反 转 ; 广义 可 评估 性 理论 ; 决策 双 系 统 ; 助 推 


内 含 2 万 词 条 。 显 然 ， 当 购买 者 同时 看 到 两 本 词典 
时 ( 即 联合 评估 )， 他 /她 对 词典 B 的 出 价 会 更 高 。 但 
是 ， 如 果 单 独 评估 ， 每 个 购买 者 只 能 看 到 其 中 一 本 
词典 ， 他 /她 对 封面 完好 的 词典 A 的 出 价 更 高 (Hsee， 
1996)。 

单独 评估 和 联合 评估 的 偏好 反 转 (下 文 简称 
JE/SE 偏好 反 转 ) 至 今 仍然 是 研究 的 热点 ,各 类 相关 
现象 丰富 有 趣 , 解释 机 制 逐 步 细 化 ,理论 的 延伸 和 
现实 的 应 用 更 是 不 断 发 展 。 

在 新 现象 的 发 现 层 面 , 许多 研究 在 探讨 : 单独 
评估 中 发 现 的 效应 是 否 在 联合 评估 中 仍然 成 立 ? 
还 是 会 减弱 、 消 失 , 甚至 反 转 ? 例如 Chatterjee, 
Heath 和 Min (2009) 探 讨 了 单独 评估 中 已 经 发 现 的 
心理 账户 效应 是 否 在 联合 评估 时 仍然 成 立 ， 发 现 只 
有 当 联 合 评估 提供 的 情景 间 比 较 使 得 人 们 认为 两 
种 情况 差异 较 小 时 (例如 丢失 10 元 的 门票 和 10 元 
现金 在 财务 损失 方面 差异 较 小 )， 心理 账 户 效 应 才 
会 减弱 。 又 如 Evers, Inbar, Blanken 和 Oosterwijk 
(2017) 考 察 了 同一 个 政策 采用 奖励 框架 (提高 句 官 
捐献 者 的 受 助 优先 级 ) 或 惩罚 框架 (降低 非 捐 献 者 的 
受 助 优先 级 ) 的 效果 ， 发 现 单 独 评估 时 人 们 认为 奖 
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励 框架 更 合理 ， 联 合 评估 时 ， 即 使 意识 到 两 种 框架 
的 实际 结果 相同 ， 人 们 仍然 觉得 奖励 框架 更 合理 ， 
这 种 现象 违反 了 规范 性 解释 (normative explanation, 
即 理 性 解释 )。 

在 理论 解释 层面 , 广义 可 评估 性 理论 (general 
evaluability theory, GET; Hsee & Zhang, 2010; 
Zhang，2015) 从 选项 属性 的 可 评估 性 (evaluability) 
的 角度 进行 了 分 析 , 理论 简洁 ,解释 力 最 强 。 另 外 ， 
想 要 和 应 要 冲突 (want-should conflict), 决策 的 双 系 
统 理论 等 也 常用 于 解释 JE/SE 偏好 反 转 ,这 些 解 释 
和 可 评估 性 也 有 一 定 的 关联 。 

最 后 ， 更 为 重要 的 是 , 评估 模式 和 广义 可 评估 
性 理论 可 应 用 于 政策 制订 , 通过 设计 合理 的 评估 模 
式 , 在 对 风险 决策 、 路 期 决策 、 花 善 捐赠 、 消 费 选 
择 、 商 业 定价 以 及 幸福 感 等 方面 助 推 人 们 做 出 更 好 
的 决策 ， 提 升 决策 的 客观 质量 或 者 消费 者 的 满意 感 
Z, 甚至 提高 人 们 的 幸福 感 。 

本 文 将 按照 现象 、 内 部 机 制 、 助 推 决策 三 个 层 
次 来 介绍 单独 评估 和 联合 评估 的 研究 。 首 先 ， 回顾 
JE/SE 偏好 反 转 的 主要 现象 。 其 次 , 在 解释 机 制 层 
面 , 介绍 可 评估 性 和 其 他 解释 。 最 后 ,将 评估 模式 
YEON BITE Be, 无论 对 消费 者 个 人 生活 ,还 是 公共 
领域 (如 慈善 、 健 康 等 方面 )， 都 能 有 所 启迪 。 总 之 ， 
单独 评 佑 与 联合 评估 是 一 个 既 具 理论 重要 性 、 又 有 
前 沿 性 的 话题 ,是 决策 研究 的 蓝海 之 一 ,特别 是 在 
现实 应 用 层面 ， 如何 设计 恰当 的 评估 模式 来 助 推 明 
智 决策 , 评估 模式 的 研究 具有 很 高 的 潜力 。 


1 评估 模式 和 偏好 反 转 


1.1 JE/SE 偏好 反 转 的 主要 现象 

理性 决策 的 恒定 性 原则 假设 , 决策 者 不 会 受到 
备 选 方案 表现 形式 的 影响 (von Neumann & Morgen- 
stern，1944), 但 是 关于 评估 模式 的 研究 却 发 现 , 决 
策 者 违背 了 恒定 性 原则 。 相 比 于 单独 评估 ， 联 合 评 


或 者 “总 收入 较 低 但 收入 递增 ”这 两 种 方案 时 ， 人 们 
偏爱 总 收入 较 高 的 前 者 ; 但 是 , 在 单独 评估 中 , 收 
人 递增 的 方案 被 认为 更 好 。 

在 慈善 捐赠 中 , Kahneman 和 Ritov (1994) 发 现 ， 
在 联合 评估 时 ， 面 对 两 个 慈善 项 目 “ 海 豚 救 助 "? 和 
“为 农民 提供 防晒 以 预防 皮肤 癌 ? 时 ， 人 们 对 预防 皮 
KURA MES; 但 是 ,单独 呈现 一 个 慈善 项 
Abt, AICP RRR, 看 到 海豚 救助 时 ,参与 
者 捐款 更 多 。 

在 人 事 招聘 中 , Hsee (1996) 请 参与 者 想象 自己 
作为 咨询 公司 的 老板 需要 招聘 一 位 软件 工程 师 。 两 
位 候选 人 都 毕业 于 同一 院 校 ， 其 中 候选 人 A 的 学 业 
绩 点 (GPA) 为 4.9 分 (5 分 制 )， 两 年 内 写 了 10 个 程序 ; 
候选 人 B 的 GPA 为 3.0 分 (5 分 制 )， 两 年 内 写 了 20 
个 程序 。 在 联合 评估 时 ， 人 们 愿意 为 候选 人 B 支付 
更 高 的 薪酬 ; 但 是 在 单独 评估 时 ， 人 们 愿意 为 候选 
人 A 支付 更 高 的 薪酬 。 

在 医疗 决策 中 ，Zikmund-Fisher，Fagerlin 和 
Ubel (2004) 让 人 们 想象 自己 要 预约 医生 为 自己 做 
眼 部 手术 。 医 生 A 毕业 于 哈佛 大 学 , 进行 过 80 次 
PAR, 都 比较 成 功 ; 医生 B 毕业 于 爱人 荷 华 大 学 , UE 
行 过 300 次 手术 , 都 比较 成 功 。 在 单独 评估 时 ， 人 们 
预约 哈佛 毕业 的 医生 A 的 意愿 更 强 ; 但 是 在 联合 评 
佑 中， 人们 更 倾向 于 预约 手术 经 验 较 丰富 的 医生 Bo 

在 道德 判断 领域 ，Paharia，Kassam，Greene 和 
Bazerman (2009) 研 究 了 人 们 对 “间接 引发 较 大 危 
害 的 不 道德 行为 ”和 “直接 引发 较 小 危害 的 不 道德 
行为 ”的 判断 。 在 单独 评估 时 ， 人 们 觉得 直接 引发 危 
害 的 行为 更 不 道德 ; 但 是 在 联合 评估 时 ， 人 们 的 道 
德 判 断 发 生 反 转 ， 认 为 间接 引发 较 大 危害 的 行为 更 
不 道德 。 

总 之 ,在 产品 消费 、 收 入 分 配 、 人 事 招 聘 、 医 
疗 决策 和 道德 判断 等 诸多 领域 ， 都 存在 着 JE/SE 偏 
好 反 转 。 值 得 注意 的 是 ，JE/SE 偏好 反 转 不 是 由 于 


佑 时 存在 其 他 选项 的 比较 ， 让 人 们 产生 偏好 的 变化 ,， 
这 类 现象 就 称 为 JE/SE 偏好 反 转 。JE/SE 偏好 反 转 
在 许多 领域 中 都 广泛 存在 。 

在 收入 领域 , Bazerman, Loewenstein 和 White 
(1992) 考 察 了 人 们 对 两 种 报酬 方式 的 偏好 。 方 案 A 
是 自己 获得 600 美元 , 他 人 获得 800 美元 ; 方案 B 
是 自己 和 他 人 各 获得 400 美元 。 在 联合 评估 中 ,大 
部 分 人 选择 自己 获 利 更 多 的 A 方案 ; 但 是 在 单独 评 
佑 时 , B 方案 被 评 为 吸引 力 更 高 。Hsee (1993) 发 现 ， 
当 实 验 参 与 者 同时 面 对 “ 总 收入 较 高 但 收入 递减 ” 


因 变 量 测量 方式 不 同 带 来 的 虚假 的 回应 差异 。 例 如 
在 音乐 词典 (Hsee，1996) 和 慈善 捐款 (Kahneman & 
Ritov, 1994) 等 研究 中 ,无 论 单独 评估 还 是 联合 评估 
时 ,消费 者 的 偏好 都 采用 支付 意愿 (willingness to 
pay) 来 测量 。 接 下 来 , 我们 将 介绍 JE/SE 偏好 反 转 
中 一 部 分 特殊 的 现象 , 这 类 现象 不 仅 和 上 述 JE/SE 


偏好 反 转 现象 一 样 , 违反 了 理性 决策 的 恒定 性 原则 ， 


而 且 还 违反 了 决策 的 占 优 性 原则 。 
1.2 单独 评估 中 违反 占 优 性 原则 的 现象 
理性 决策 的 占 优 性 原则 是 指 , 个 体 永远 都 不 会 
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采用 一 个 被 其 他 策略 或 选项 占 优 的 策略 或 选项 。 占 
优 包括 两 种 情况 : 一 是 强势 占 优 , 指 一 项 策略 或 选 
项 在 所 有 方面 都 比 其 他 策略 和 选项 更 好 ; 二 是 弱势 
占 优 ,， 指 一 项 策略 或 选项 至 少 在 某 一 方面 比 其 他 策 
略 或 选项 更 好 , 在 其 他 方面 与 其 他 策略 和 选项 一 样 


者 展示 了 两 套 卡 片 :一 套 是 10 张 寻 新 卡片 套装 ; 而 
另 一 套 则 是 13 KER, 包含 了 前 一 套装 一 样 的 10 
张 新 卡 再 加 上 3 张 中 等 旧 的 卡片 。 如 果 两 套 卡 片 摆 
放 在 一 起 ,卡片 收藏 者 对 13 张 套装 的 出 价 更 高 。 但 


好 (Von Neumann & Morgenstern, 1944)。 评 估 模 式 
的 研究 发 现 ,在 单独 评估 时 ， 人 们 有 时 会 违反 占 优 
性 原则 ， 偏 好 那些 被 其 他 选项 占 优 的 选项 。 

Hsee (1998) 通 过 冰激凌 实验 演示 了 该 现象 。 他 
请 实验 参与 者 想象 自己 在 湖畔 休息 时 想 吃 冰淇淋 。 
单独 评估 时 ,参与 者 随机 分 配 到 以 下 两 种 情形 之 一 
(如 图 1 所 示 ): 摊位 H 出 售 8 ae VK, 装 在 容 
量 10 桨 司 的 纸杯 里 ; 摊位 工 出 售 7 盎司 冰激凌 ， 装 
在 容量 5 玲 司 的 纸杯 里 ; 联合 评估 时 , 参与 者 同时 
看 到 了 两 种 情况 。 结 果 发 现 : 联合 评估 时 ， 人 们 对 
8 淮 司 冰激凌 给 出 了 更 高 的 价格 ; 但 是 在 单独 评估 
时 ， 人 们 的 支付 意愿 违背 了 占 优 性 原则 ， 人 们 对 溢 
出 纸杯 的 7 at Oe HH PE, 虽然 8 te] ykýk 
凌 才 是 占 优选 项 。 


F 


摊位 H 摊位 L 


图 1 冰淇淋 示意 图 
(资料 来 源 : Hsee, 1998) 


类 似 的 , 餐具 套装 的 选择 也 是 一 个 经 典 例证 ， 
2002 年 诺 贝 尔 经 济 学 奖 获得 者 卡 尼 曼 教 授 在 其 获 
奖 致 辞 中 专门 提 及 了 此 研究 。 假 设 你 准备 购买 一 套 
和 餐具， 有 两 组 套装 。 套装 A 共 24 PRA, EE, wi 
和 甜点 盘 各 8 个 ,每 一 件 都 完好 无 损 。 套 装 B 共 40 
件 餐 具 , 包含 了 套装 A 所 有 的 24 件 ， 并且 新 增 了 杯 
FARES 8 个 ,其 中 7 个 完好 , 9 个 破损 了 。 也 
就 是 说 ,除了 完全 一 样 的 24 件 餐具 ， 套 装 B 还 比 套 
装 A 多 出 了 7 件 完 好 的 和 餐具， 是 客观 上 更 好 的 选 
项 。 在 联合 评估 时 ， 人 们 对 套装 B 的 出 价 更 高 ; 但 
是 在 单独 评估 时 ， 人 们 对 套装 A 的 出 价 更 高 (Hsee， 
1998)。 

这 一 效应 在 其 他 领域 也 得 到 了 多 次 确证 。 在 现 
实 的 二 手 棒球 卡片 交易 市 场 中 , List (2002) 发 现 ， 即 
使 是 有 经 验 的 购买 者 也 会 受到 此 效应 的 影响 。 人 研究 


是 如 果 只 摆 出 其 中 一 套 , 卡片 收藏 者 对 10 KER 
的 出 价 更 高 。 此 外 ,最 新 一 项 研究 发 现 : 在 对 他 人 
学 术 能 力 的 评估 中 , 学 术 专 家 们 (教授 和 博士 生 ) 也 
难免 于 此 效应 。 有 两 位 申请 人 的 简历 : 申请 人 A 的 
8 篇 论文 都 发 表 于 排名 靠 前 的 期 刊 上 ,申请 人 B 同 
样 发 表 了 8 篇 排名 靠 前 期 刊 上 的 论文 , 但 还 额外 有 
6 篇 论文 发 表 在 排名 较 后 期 刊 上 。 如 果 专 家 们 处 于 
联合 评估 模式 ， 同 时 看 到 两 份 简历 , 那么 对 两 个 申 
请 人 的 学 术 能 力 的 评估 没有 差异 ; 但 是 当 专 家 处 于 
单独 评估 模式 ， 只 看 到 其 中 一 份 简历 时 ， 对 申请 人 
A 的 评估 显著 高 于 申请 人 B (Powdthavee, Riyanto, 
& Knetsc, 2017). 


2 常见 的 解释 机 制 


2.1 可 评估 性 理论 

为 何在 不 同 评估 模式 下 ， 人 们 的 偏好 会 出 现 反 
转 ? 目前 最 简洁 有 力 的 解释 是 可 评估 性 的 影响 。 所 
谓 可 评估 性 ,是 人 们 对 某 个 客观 属性 进行 主观 优 劣 
判断 时 的 难 易 程 度 和 自信 程度 (Hsee, 1996; see Hsee 
& Zhang, 2010 as a review)。 简单 来 说 , 属性 的 优 劣 
越 容易 判断 ， 则 可 评估 性 越 高 ， 越 难 判 断 ， 则 可 评 
估 性 越 低 。 研 究 者 对 可 评估 性 进行 测量 时 ,通常 会 
询问 参与 者 认为 选项 属性 是 否 容易 评估 (e.g. Hsee, 
1996; Hsee, Zhang, Wang, & Zhang, 2013), 例如 大 
学 生 参 与 者 认为 GPA 比 编程 经 验 更 容易 判断 (Hsee， 
1996). 

值得 注意 的 是 ,在 前 文 提 到 的 所 有 JE/SE 偏好 
反 转 中 , 所 有 选项 总 是 涉及 到 两 个 属性 的 权衡 一 一 
一 个 属性 重要 但 难以 单独 评估 ; 另 一 个 属性 不 太 重 
要 但 容易 单独 评估 。 所 以 , JE/SE 偏好 反 转 的 研究 中 ， 
选项 通常 在 两 个 属性 上 各 有 优 劣 ( 见 表 1)。 比如 , 在 
选择 主刀 医生 的 情境 中 (Zikmund-Fisher et al., 
2004), 手术 经 验 (手术 次 数 ) 是 一 个 重要 但 是 难以 单 


表 1 JE/SE 偏好 反 转 的 选项 结构 


i 重要 但 难以 单独 不 太 重 要 但 容易 
LEHL ane = Se es 
评估 的 属性 单独 评估 的 属性 
较 好 BEE 
选项 
ERA bi: 完成 300 次 手术 ) (Bil: 毕业 于 爱 荷 华 大 学 ) 
EI 较 好 


( 例 : 完成 80 次 手术 ) 


( 例 : 毕业 于 哈佛 大 学 ) 
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独 评估 的 属性 ; 相对 于 经 验 ， 毕业 院 校 却 是 一 个 没 
那么 重要 但 是 容易 单独 评估 的 属性 。 

在 单独 评估 时 ,容易 评估 的 属性 对 决策 产生 更 
影响 ,即使 该 属性 没 那么 重要 ; 但 在 联合 评估 时 ， 
如 果 重 要 的 属性 变 得 更 容易 评估 了 ， 人 们 的 偏好 就 
会 发 生变 化 。 仍 以 医生 选择 为 例 ， 单独 评 佑 时， 人 
们 更 愿意 预约 哈佛 毕业 的 医生 ， 因 为 大 学 是 一 个 容 
易 评估 的 属性 ， 即 使 人 们 知道 手术 经 验 更 为 重要 ， 
但 由 于 没有 参照 点 ， 人 们 难以 判断 进行 过 多 少 次 手 
术 算 是 经 验 丰富 ; 在 联合 评估 时 ， 有 两 个 选项 互相 
对 比 ， 手术 次 数 这 个 更 重要 的 属性 变 得 容易 评估 了 ， 
人 们 就 会 更 愿意 预约 经 验 丰富 的 医生 。 这 就 是 可 评 
估 性 的 变化 会 引起 决策 者 的 偏好 反 转 。 下 面 ， 我 们 
将 具体 介绍 哪些 因素 会 导致 可 评估 性 的 变化 。 
2.2 ”可 评估 性 的 影响 因素 

根据 广义 可 评估 性 理论 ， 某 个 属性 的 可 评估 性 
越 高 ， 人们 对 其 价值 的 评估 就 越 敏 感 ， 因 为 人 们 可 
以 轻松 自信 地 察觉 到 这 一 属性 上 的 差异 ; 而 价值 敏 
感性 越 高 ， 该 属性 对 决策 的 影响 程度 就 更 大 。 正 是 
因为 选项 不 同属 性 和 可 评估 性 的 交互 , JE/SE 偏好 
反 转 的 现象 才 会 发 生 。 那 么 , 什么 因素 会 影响 可 评 
估 性 呢 ? 

可 评估 性 是 依赖 于 参照 系统 的 ， 存在 参照 信息 
的 情况 下 ， 可 评估 性 就 较 高 。 广 义 可 评估 性 理论 所 
出 了 三 个 重要 的 影响 因素 。(1) 天 性 (nature), 是 内 在 
的 参照 信息 ,反映 了 人 类 长 期 进化 而 来 的 参照 信息 
体系 ; (2) 知 识 (knowledge)， 是 习 得 的 参照 信息 ， 即 
过 去 是 否 学 习 和 积累 了 目标 属性 的 数值 分 布 作为 
参照 信息 ; (3) 评 佑 模式 (mode),， 是 当下 的 参照 信息 ， 
是 否 有 其 他 选项 作为 参照 信息 。 只 要 有 一 项 因素 的 
可 评估 性 较 高 ， 可 评估 性 就 高 ,相应 的 价值 敏感 性 
也 越 高 (如 图 2 所 示 )。 


该 属性 是 否 内 在 可 评估 性 高 ? 


是 否 


决策 者 是 否 有 相关 知识 (了 解 其 数值 分 布 )? 


是 T 


y 


评价 模式 是 否 为 联合 评价 ? 


是 否 


y 
价值 敏感 性 低 


图 2 可 评估 性 和 价值 敏感 性 的 影响 因素 


价值 敏感 性 高 


因素 1: AEE, 是 指 人 类 对 于 所 评估 的 价值 是 
否 有 天 然 存在 的 、 稳 定 的 生理 或 者 心理 度量 ( 即 一 
个 参照 系统 )。 如 : 舒适 温度 、 有 睡眠 充足 与 否 、 社 
交 孤 独 等 方面 人们 无 需 学 习 ， 即 有 天 然 的 、 内 在 
的 参照 系统 可 以 做 出 评估 。 但 是 ， 对 于 钻石 的 大 小 、 
汽车 的 马力 等 问题 人们 没有 天 然 的 、 内 在 的 评估 
系统 ， 需 要 学 习 相 关 知 识 或 者 比较 其 他 选项 才能 评 
WERE. AB 2: 知识 , 是 指 评估 者 本 人 是 和 否 了 
解 目 标 属性 的 数值 分 布 信息 (例如 : 数值 范围 、 均 
值 等 )。 例 如 : 经 常 购买 红酒 的 消费 者 对 红酒 的 年 
份 、 产 地 等 信息 拥有 更 多 知识 , 在 出 价 的 时 候 比 新 
手 更 依赖 于 知识 进行 判断 (Gustafson，Lybbert， 信 
Sumner, 2016)。 一 般 而 言 ， 人 们 对 于 类 别 信 息 的 知 
识 较 多 , 但 是 对 于 数量 信息 的 知识 较 少 。 比 如 : 我 
们 都 知道 收益 是 好 的 , 损失 是 坏 的 , 但 是 收益 多 少 
钱 、 收 益 率 有 多 高 才 是 好 的 ,不 是 理财 专家 就 难以 
评估 。 因 素 3: 评估 模式 , 也 就 是 单独 评估 还 是 联 
合 评估 , 在 单独 评估 时 ， 因 为 不 存在 选项 之 间 的 参 
HA, 可 评估 性 较 低 ; 联合 评估 时 ， 由 于 选项 可 以 互 
为 参照 ， 可 评估 性 较 高 。 

基于 广义 可 评估 性 理论 ， JE/SE 的 偏好 反 转 现 
象 其 实 可 以 归 为 两 种 类 型 。 一 类 是 评估 模式 和 选项 
属性 (天 性 ) 的 交互 作用 ,， 另 一 类 是 评估 模式 和 选项 
属性 (知识 ) 的 交互 作用 。 

2.2.1 评估 模式 和 选项 属性 (天 性 ) 的 交互 

评估 模式 和 选项 属性 (天 性 ) 的 交互 作用 中 , 选 
项 一 般 涉及 到 两 个 属性 ， 其 中 一 个 属性 是 不 太 重 要 
但 是 内 在 易 评 估 的 (例如 电子 相框 是 否 美观 )， 男 一 
个 属性 是 更 为 重要 但 内 在 难 评估 的 (例如 电子 相框 
分 辩 率 的 高 低 )， 需 要 通过 比较 的 方式 来 评估 的 。 相 
比 于 内 在 难 评估 的 属性 ， 内 在 易 评 估 的 属性 在 单独 
评估 中 权重 更 大 ; 但 是 到 联合 评估 的 模式 下 ， 因 为 
有 选项 间 的 参照 , 内 在 难 评估 的 属性 可 评估 性 提高 ， 
在 决策 中 的 权重 也 会 变 大 。Yang, Hsee, Liu 和 Zhang 
(2011) 让 人 们 选择 两 个 电子 相框 : 一 个 分 辩 率 更 高 
但 是 外 观 难 看 ,一 个 分 状 率 低 但 是 外 观 漂亮 。 当 处 
于 单独 评估 时 ， 人 们 更 多 选择 好 看 的 相框 ， 因 为 美 
观 是 一 种 内 在 可 评估 性 很 高 的 因素 , 我 们 无 需 比 较 
就 可 以 判断 美 丑 ; 当 处 于 联合 评估 时 ， 人 们 更 多 选 
择 难看 但 分 辩 率 高 的 相框 ， 因 为 通过 选项 间 的 互相 
比较 ， 分 辨 率 这 一 内 在 难以 评估 的 属性 变 得 更 容易 
评估 了 ， 人 们 的 偏好 就 发 生 了 变化 。 值 得 注意 的 是 ， 
在 本 研究 中 , 研究 者 对 单独 评估 组 也 采用 了 组 内 设 
th, 参与 者 首先 观看 一 个 电子 相框 , 然后 有 10 分钟 
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的 间隔 时 间 完 成 填充 任务 , 然后 再 观察 男 一 个 相 
框 。 这 部 分 研究 表明 ,单独 评估 和 联合 评估 的 差异 
不 是 组 间 和 组 内 设计 的 差异 导致 的 ， 而 确实 是 评估 
模式 的 差异 造成 的 。 

2.2.2 ”评估 模式 和 选项 属性 (知识 ) 的 交互 

评估 模式 和 选项 属性 (知识 ) 的 交互 作用 中 ， 选 
项 一 般 涉及 到 两 个 属性 ， 其 中 一 个 属性 是 不 重要 但 
是 人 们 知识 较为 丰富 的 ， 另 一 个 属性 是 重要 但 是 人 
们 的 知识 较为 缺乏 的 。 因 此 , 不 重要 但 是 知识 丰富 
的 属性 在 单独 评估 中 权重 更 大 ,重要 但 是 知识 缺乏 
的 属性 在 联合 评估 中 权重 更 高 。 例 如 ， 医 疗 决策 的 
研究 发 现 , 单独 评估 时 ， 人 们 更 偏好 成 功率 33% 但 
距离 自己 家 15 分 钟 的 生育 门诊 , 但 是 在 联合 评估 
时 ， 人 们 更 偏好 成 功率 40% 但 距离 自己 家 40 分 钟 
的 生育 门诊 (Zikmund-Fisher et al, 2004)。 因 为 花费 
时 间 这 一 维度 上 ， 人 们 拥有 更 多 的 知识 和 了 解 ; 但 
是 医院 的 成 功率 这 一 维度 上 ， 人 们 的 了 解 较 少 , 在 
联合 评估 时 有 选项 间 的 参照 才能 提高 其 可 评估 性 。 

评估 模式 和 知识 的 交互 中 存在 一 个 典型 子 类 
别 ， 即 评估 模式 和 类 别 - 数 量 信息 的 交互 。 以 前 文 
提 到 的 餐具 套装 的 选择 为 例 (Hsee，1998), 一 套餐 
具 数 量 多 但 有 破损 , 一 套餐 具 数 量 少 但 都 很 完好 ， 
选项 中 存在 餐具 数量 和 是 否 完好 两 个 维度 。 在 单独 
评估 时 ， 餐 具 是 否 完好 作为 类 别 信息 ， 人 们 拥有 较 
多 了 解 ， 容 易 评 佑 ， 因 此 餐具 是 否 完 好 对 评估 的 影 
响 高 ; 而 在 联合 评估 时 ， 因 为 有 了 选项 间 的 参照 ， 
数量 信息 的 可 评估 性 提高 了 ， 对 决策 的 影响 也 增 大 
T o 类 似 原理 的 ,关于 道德 判断 的 研究 中 (Paharia et 
al.，2009)， 研 究 者 对 比 了 两 种 不 道德 行为 (间接 引 
发 较 大 危害 的 行为 和 直接 引发 较 小 危害 的 行为 )。 
在 单独 评估 时 ， 直 接 还 是 间接 引发 是 类 别 信 息 ,不 
需要 参照 也 很 容易 评估 ， 因 此 人 们 觉得 直接 引发 危 
害 的 行为 更 不 道德 ; 但 是 在 联合 评估 时 ,危害 程度 
这 种 数量 信息 的 可 评估 性 提高 了 , 因此 人 们 对 两 种 
行为 的 判断 反 转 了 。 

2.3 其 他 解释 

虽然 广义 可 评估 性 理论 是 目前 解释 力 最 强 的 
理论 , 但 还 有 其 他 解释 机 制 提供 了 不 同 的 视角 。 下 
面 我 们 将 简要 予以 介绍 。 

Bazerman 等 (1992) 提 出 了 “ 想 要 和 应 要 冲突 ” 
(want-should conflict) 的 解释 ,他们 认为 ,在 单独 评 
估 时 个 体 更 多 考虑 到 “ 想 要 ”(want) 的 因素 , 但 是 联 
合 评估 时 个 体 更 多 思考 “应 要 ”(should) 的 因素 。 例 
如 : Okada (2005) 发 现 ， 面 对 享乐 选项 (50 元 餐厅 代 


金 券 ) 和 实用 选项 (50 元 超市 食品 代金 券 ) 的 取舍 ， 
在 单独 评估 时 ， 人 们 更 喜爱 享乐 选项 ,在 联合 评估 
时 ， 人 们 更 喜欢 实用 选项 。 类似 的 , Shaffer 和 Arkes 
(2009) 发 现 ， 人 们 在 联合 评估 中 更 喜欢 现金 报酬 ， 
但 是 在 单独 评估 时 ,， 非 现金 报酬 (特别 是 享乐 品 而 
非 实用 品 ) 更 受 人 喜欢 。 这 类 现象 可 以 用 想 要 和 应 
要 的 冲突 来 解释 。 单 独 评估 时 ,享乐 选项 激发 了 更 
多 想 要 的 渴望 ， 而 联合 评估 时 ， 如 果 要 选择 享乐 选 
项 ， 人 们 会 考虑 应 要 的 因素 ， 比 如 是 否 存在 合理 的 
理由 。 不过, 这 类 现象 也 可 以 用 可 评估 性 解释 ， 相 
比 于 实用 性 , 享乐 属性 的 内 在 可 评估 性 较 高 ,因此 
在 单独 评估 时 影响 更 大 。 

Kahneman 和 Ritov (1994) 提 出 了 组 内 比较 和 组 
外 比较 的 差异 。 他 们 探讨 了 “救助 海豚 项 目 ”* 和 “ 预 
防 皮肤 癌 项 目 ”" 偏 好 反 转 的 原因 ,指出 :在 单独 评估 
时 ， 人 们 更 多 进行 组 内 比较 , 海豚 组 把 海豚 救援 和 
其 他 动物 救援 比较 , 海豚 属于 动物 中 人 们 更 愿意 救 
助 的 ; 防晒 组 把 增加 防晒 措施 来 预防 皮肤 癌 项 目 和 
其 他 人 类 救援 比较 , 这 一 项 目 属于 人 类 救援 中 比较 
不 重要 的 。 联合 评估 时 ， 人 们 更 多 进行 了 组 外 比较 ， 
显然 救助 人 类 比 救助 动物 更 重要 。 其实 组 内 组 外 比 
较 的 核心 机 制 和 可 评估 性 一 样 ， 都 是 参照 信息 。 用 
广义 可 评估 性 理论 来 解释 ,单独 评估 时 ， 救 海豚 和 
救 人 两 个 项 目 内 在 的 参照 系统 是 不 同 的 ; 但 是 联合 
评估 时 ， 当 前 的 参照 选项 就 成 为 更 凸显 的 参照 点 ， 
参照 点 的 变化 引起 了 偏好 改变 。 

Hit, Sher 和 McKenzie (2014) 提 出 了 “选项 即 
信息 ”模型 (option as information model), 指出 : 个 
体 在 看 到 选项 前 对 属性 的 数值 分 布 有 一 个 推断 , 但 
每 看 到 一 个 选项 就 类 似 一 次 抽样 ,每 次 抽样 后 都 会 
更 新 自己 推断 的 模型 ,再 根据 新 形成 的 参照 模型 来 
判断 。 从 本 质 上 而 言 ， 选 项 即 信息 模型 和 可 评估 性 
都 采用 了 参照 信息 来 解释 , 但 该 模型 的 重点 在 于 论 
证 JE/SE 偏好 反 转 并 不 是 非 理性 的 ,， 反而 是 因为 有 
了 其 他 选项 作为 新 信息 ， 人 们 理性 地 重新 推理 , 才 
发 生 了 偏好 的 改变 。 

此 外 ， 双 系统 理论 也 常 被 用 于 解释 JE/SE 差 
异 。 在 单独 评估 中 , 个 体 更 多 依赖 系统 1 的 启发 式 
加 工 ; 在 联合 评估 中 , 个 体 更 多 依赖 系统 2 的 分 析 
式 加 工 (Gino, Moore, & Bazerman, 2008; Bazerman, 
Gino, Shu, & Tsay, 2011). Gino 等 (2008) 提 出 , 日 常 
生活 中 , 我 们 可 能 面临 两 类 不 道德 行为 : 一 种 是 过 
程 重度 不 道德 , 恰巧 有 积极 后 果 , 另 一 种 是 过 程 轻 
度 不 道德 ,恰巧 有 消极 结果 (所 谓 恰 巧 ,是 指 行为 
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者 并 不 能 控制 后 果 , 结果 好 坏 只 是 随机 概率 问题 )。 
在 单独 评估 时 ， 人 们 容易 出 现 结果 偏差 .觉得 “过 
程 轻 度 不 道德 但 恰好 产生 消极 结果 的 行为 "更 不 道 
德 ; 在 联合 评估 时 ,偏差 会 减弱 。 为 了 证 明 双 系统 
的 影响 ,研究 者 在 单独 评估 时 ， 启动 参与 者 进行 
觉 或 者 理性 加 工 , 发 现 理 性 加 工 确实 能 减弱 结果 偏 
差 。 但 是 , 值得 注意 的 是 ， 如 果 该 研究 能 在 联合 评 
估 的 模式 下 启动 系统 1 的 加 工 方式 也 发 现 结果 偏差 
增 大 , 才能 更 确切 地 证 明 其 中 的 因果 关系 。 同 样 的 ， 
这 一 现象 也 可 以 用 可 评估 性 来 解释 , 结果 的 积极 或 
消极 是 一 种 类 别 信息 ,在 单独 评估 时 可 评估 性 较 高 ; 
而 过 程 的 轻微 或 重度 不 道德 是 数量 信息 ,在 联合 评 
估 时 可 评估 性 较 高 。 

广义 可 评估 性 理论 中 的 评估 模式 和 选项 维度 
(知识 或 天 性 ) 的 交互 与 双 系 统 有 一 定 程度 的 相似 。 
一 般 而 言 ， 内 在 可 评估 性 高 的 因素 经 常 和 系统 1 比 
较 相 关 ， 依 赖 于 直觉 和 情绪 ， 内 在 可 评估 性 低 的 因 
素 和 系统 2 相关 , 依赖 于 分 析 和 计算 。 正 如 前 文 提 
到 的 外 观 美 丑 ， 是 一 种 内 在 可 评估 性 很 高 、 且 依靠 
直觉 判断 的 因素 ; 而 各 类 数字 信息 , 无 论 是 手术 经 
验 、 屏 幕 分 辨 率 的 高 低 等 等 ， 都 是 需要 分 析 、 计 算 
才能 理解 的 。 类 似 的 ， 知 识 丰 富 的 信息 ， 可 能 已 经 
转化 为 个 体 自己 的 经 验 法 则 ,依靠 系统 1 的 启发 式 
加 工 即 可 迅速 完成 ; 而 知识 贫乏 的 信息 ， 如 果 人 们 
不 进行 较 慢 的 分 析 和 计算 则 难以 推 新 和 评估 。 
虽然 双 系统 理论 具有 很 高 的 普 适 性 , 但 是 , 在 
JE/SE 偏好 反 转 问题 上 , 广义 可 评估 性 理论 具有 更 
为 独特 的 解释 力 , 许多 现象 单纯 使 用 双 系 统 理 论 难 
以 充分 解释 。 例 如 : Zikmund-Fisher 等 (2004) 关 于 
医生 选择 的 研究 , 在 单独 评估 时 ， 人 们 更 愿意 选择 
毕业 于 哈佛 大 学 .进行 过 80 次 手术 的 医生 ,在 联合 
评估 时 ， 人 们 更 愿意 选择 毕业 于 爱 荷 华 大 学 、 进 行 
过 300 次 手术 的 医生 。 即 使 在 单独 评估 时 要 求人 们 
理性 思考 采用 系统 2 加 工 , 或 者 在 联合 评估 时 增加 
人 们 的 认 知 负荷 使 人 们 采用 系统 1 加 工 , RR GR 
难以 消除 这 种 偏好 反 转 ， 并 不 是 只 要 采用 系统 2 
的 分 析 思 考 就 能 完全 弥补 知识 缺乏 或 者 内 在 难以 
评估 带 来 的 影响 。 
3 评估 模式 助 推 明智 决策 

研究 人 类 的 判断 和 决策 , 不 仅 是 希望 解释 其 中 
的 规律 ， 更 重要 的 是 去 影响 现实 ， 帮 助人 们 改善 和 
提升 决策 的 结果 。 单独 评估 和 联合 评估 在 现实 中 可 
操作 性 极 高 ， 因 此， 完全 可 以 通过 对 决策 模式 或 信 


息 呈 现 的 设计 ， 助 推 人 们 的 决策 。 下 面 , 我 们 将 从 
以 下 几 个 不 同 的 领域 ， 分 别 介绍 评估 模式 会 如 何 影 
响 人 们 的 决策 ， 和 希望 能 启发 政策 的 设计 者 选择 合适 
的 评估 模式 ， 达 成 助 推 的 目的 。 
3.1 风险 决策 

生活 在 充满 风险 和 不 确定 性 的 世界 中 , 个 体 的 
许多 经 济 决策 都 与 此 相关 , 例如 理财 投资 中 更 保守 
还 是 更 冒险 , 是 否 购买 彩票 奖券 等 产品 。Hsee 及 其 
同事 提出 : 评估 模式 对 于 个 体 的 风险 决策 有 显著 影 
响 (Hsee, Zhang, Wang, et al., 2013)。 

众所周知 ,在 风险 和 跨 期 决策 的 研究 中 ,最 重 
要 的 就 是 三 种 水 数 : 一 是 效用 函数 (value function or 
utility function, Kahneman & Tversky，1979)， 二 十 
时 间 折 扣 函 数 (temporal discounting function, Fredrick, 
Loewenstein, & O’Donoghue, 2002), 三 是 概率 权重 
PK (probability weighting function, Kahneman & 
Tversky, 1979)。 这 三 个 函数 都 是 非 线性 的 ， 特 别 是 
在 原点 附近 ( 即 价值 为 零 、 延 期 程度 为 零 、 概 率 为 
零 或 百 分 百 的 时 候 ) 更 加 陡峭 。 单 独 评估 和 联合 评 
估 可 以 影响 函数 的 非 线 性 程度 (如 图 3 所 示 ), 在 单 
独 评 佑 的 模式 下 ,函数 的 非 线 性 程度 较 高 ; 在 联合 
评估 的 模式 下 ,了 艺 数 的 非 线 性 程度 较 低 (Hsee & 
Zhang, 2010; Hsee, Zhang, Wang, et al., 2013)。 基 于 
广义 可 评估 理论 , 在 单独 评 佑 时， 人们 对 于 类 别 的 
变化 更 为 敏感 , 例如 价值 从 零 变 为 正 数 时 、 风 险 从 
无 风险 变 为 有 风险 时 ， 都 是 类 别 的 变化 ， 因 此 人 们 
的 效用 判断 发 生 了 很 大 改变 。 但 若 无 其 他 的 数量 信 
息 作 参考 时 ， 人 们 对 数量 的 变化 较为 不 敏感 ， 例 如 
发 生 概 率 从 10% 变 为 20% 时 ， 人 们 对 数量 变化 的 效 
用 判断 变化 就 不 太 大 。 因 此 ， 和 联合 评估 相 比 ， 单 
独 评估 时 的 效用 函数 、 时 间 折 扣 函 数 和 概率 权重 函 
数 在 原点 附近 的 非 线 性 程度 都 更 高 。 


图 3 评估 模式 和 效用 函数 (A)、 时 间 折 扣 函 数 (B)、 概 率 
权重 函数 (C) 
(修改 自 : Hsee & Zhang, 2010) 


现在 ,首先 讨论 风险 决策 领域 (查看 图 3 中 的 
概率 权重 函数 )， 在 确定 性 点 附近 (概率 为 0% 或 
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100%), 单独 或 联合 评 佑 时， 人 们 的 敏感 程度 是 类 
似 的 ; 但 是 ， 随 着 风险 水 平 的 上 升 ， 单独 评估 的 情 
况 下 ， 人 们 对 风险 的 变化 更 不 敏感 。 例 如 ，Hsee 等 
(2013) 发 现在 公共 政策 方面 ， 假 设 有 两 种 应 对 洪水 
的 方案 , 方案 A 可 以 100% 地 保护 2 万 人 安全 (无 风 
险 、 小 收益 ), 方案 B 有 90% 的 概率 可 以 保护 4 万 
人 安全 , 但 是 有 10% 的 概率 保护 不 了 任何 人 (有 风 
险 、 大 收益 )。 相 比 于 联合 评估 , 单独 评估 时 参与 者 
对 方案 A 的 偏好 程度 更 高 。 更 近 一 步 , 研究 者 们 请 
大 学 生 考虑 附近 新 开 的 百货 商场 正在 赠送 价值 50 
美元 的 开业 礼券 ,获奖 概率 分 别 为 100%，90% 和 
80%, 假设 自己 有 120 分 钟 的 空闲 时 间 可 以 去 排队 ， 
问 他 们 最 多 愿意 等 多 少 分 钟 。 在 联合 评估 中 ,获奖 
概率 100%, 90% 和 80% 这 三 种 条 件 下 ， 参 与 者 愿意 
等 待 的 时 间 逐 渐 下 降 , 并 且 两 两 之 间 差 异 显著 。 在 
单独 评估 中 ,对 比 获奖 概率 100% 和 90% 的 两 组 ， 
人 们 愿意 等 待 的 时 间 有 显著 差别 ; 但 是 ， 对比 获奖 
概率 90% 和 80% 的 两 组 ， 人 们 愿意 等 待 的 时 间 并 没 
有 显著 差异 ， 和 联合 评估 的 结果 不 同 。 这 就 是 说 在 
单独 评估 时 ， 人 们 只 对 于 有 无 风险 这 一 类 别 信息 敏 
感 ， 对 于 多 大 程度 的 风险 (例如 获奖 概率 90% 还 是 
80%) 这 一 数量 信息 不 敏感 。 

此 外 ,关于 不 确定 性 情况 下 ,评估 模式 如 何 影 
响 决 策 还 缺乏 系统 深入 的 研究 ,早期 Fox 和 Tversky 
(1995) 发 现 了 比较 忽略 效应 (comparative ignorance), 
认为 人 们 的 不 确定 性 规避 其 实 来 源 于 和 确定 性 的 
备 选 方 案 的 比较 ,而 当 不 存在 明显 的 比较 信息 时 ， 
人 们 其 实 并 没有 那么 回避 不 确定 性 。 他 们 邀请 参与 
者 想象 自己 面 对 这 两 个 游戏 袋 ， 里 面 装 了 红色 和 黑 
色 筹 码 ， 只 要 抽 到 红色 筹码 就 可 以 获得 100 美元 。 
袋子 A 中 有 50 个 红色 筹码 , 50 个 黑色 筹码 ; 袋子 B 
中 红色 和 黑色 筹码 一 共 100 个 , 但 是 具体 每 种 多 少 
不 清楚 。 研 究 者 询问 了 参与 者 愿意 出 价 多 少 来 参加 
这 个 游戏 。 在 联合 评估 时 ， 人 们 对 于 袋子 A 的 出 价 
显著 高 于 袋子 B, 表现 出 了 不 确定 性 规避 ; 但 是 在 
单独 评估 时 ， 人 们 对 两 个 袋子 的 出 价 却 没有 差异 。 
这 和 Hsee, Zhang, Wang 等 (2013) 的 研究 中 ， 人 们 在 
联合 评估 时 才 会 在 意 风险 的 大 小 (对 概率 数值 敏感 ) 
其 实 是 比较 符合 的 。 单独 评估 时 ， 人 们 对 袋子 A 和 
B 都 感到 结果 无 法 确定 ， 却 区 分 不 出 哪个 不 确定 性 
更 高 ,只 有 联合 评估 时 , 才 知 道 B 比 A 更 难以 预测 。 

风险 决策 中 的 评估 模式 差异 其 实 是 JE/SE 偏好 
反 转 的 一 个 子 类 ,只 是 处 于 这 种 特定 的 情境 下 。 其 
根源 还 是 选项 存在 两 个 不 同 的 属性 : 一 个 属性 为 类 


别 属 性 一 一 有 无 风险 ; 另 一 个 属性 为 数量 属性 一 一 
风险 大 小 。 在 单独 评估 时 ， 有 无 风险 的 可 评估 性 更 
高 ， 人们 对 此 较为 敏感 ， 风 险 大 小 的 可 评估 性 较 低 ， 
人 们 对 此 较为 不 敏感 ; 但 是 , 在 联合 评估 时 ， 人 们 
对 两 类 属性 都 较为 敏感 。 

因此 , 在 风险 相关 的 决策 中 ， 如 果 政 策 的 制定 
者 希望 消费 者 能 区 分 出 风险 程度 的 高 低 ， 对 概率 的 
数值 变化 更 加 敏感 , 那么 就 应 该 使 消费 者 处 于 联合 
评估 的 模式 中 ,例如 提供 股票 和 债券 两 种 投资 方式 
的 损失 概率 对 比 ， 这 样 消费 者 就 会 对 概率 的 数值 更 
敏感 。 如 果 政 策 制定 者 希望 消费 者 对 有 无 风险 这 一 
类 别 信息 更 为 敏感 , 那么 单独 评估 的 模式 更 为 有 效 。 
3.2 ” 跨 期 决策 

正如 前 文 已 经 提 及 的 , 在 跨 期 决策 领域 (观察 
图 3 中 的 时 间 折 扣 函 数 )， 在 零点 附近 (没有 延 信 )， 
单独 或 联合 评估 时 ， 人 们 对 时 间 折 扣 的 敏感 程度 差 
不 多 的 ; 但 是 ， 当 延迟 时 间 增 加 后 ,单独 评估 时 ， 
人 们 对 时 间 变 化 没有 联合 评估 时 敏感 (Hsee, Zhang, 
Wang, et al., 2013)。, 例 如 , 单独 评估 下 ， 人 们 还 会 表 
现 出 更 强 的 现时 偏差 (present bias, Laibson, 1997)。 
让 人 们 考虑 两 种 新 的 网 络 服务 套餐 : 套餐 A 速度 
2MB 每 秒 , 现在 即 可 升级 ; 套餐 B 速度 4 MB 每 秒 ， 
但 是 3 个 月 后 才 可 以 升级 。 单 独 评估 时 ,参与 者 对 
套餐 A 的 偏好 程度 比 联 合 评估 下 更 高 (Hsee, Zhang, 
Wang, et al., 2013). 此 外 ,进一步 研究 发 现 ， 让 大 学 
生 考 虑 他 们 为 一 个 初中 生 补 一 次 课 ， 就 可 赚 取 100 
元 报酬 ,如 果 报 酬 立刻 获得 、1 个 月 后 获得 、3 个 月 
后 获得 , 他 们 愿意 付出 的 补课 时 间 为 多 久 (在 0~240 
分 钟 之 间 )。 在 联合 评估 中 ,立刻 、1 个 月 后 、3 个 
月 后 获得 报酬 这 三 种 条 件 下 ,大 学 生 愿意 付出 的 补 
课时 间 递 减 , 并 且 两 两 差异 显著 。 但 是 , 在 单独 评 
估 时 , 立刻 和 1 个 月 后 获得 报酬 的 两 组 ,大 学 生 愿 
意 付 出 的 补课 时 间 有 显著 差异 , 但 是 1 个 月 后 和 3 
个 月 后 获得 报酬 这 两 组 之 间 无 差异 ; 也 就 是 说 , 单 
独 评估 时 ， 人 们 对 于 1 个 月 还 是 3 个 月 延迟 的 数量 
童 息 并 不 敏感 ， 人 们 只 对 是 和 否 有 延迟 这 一 类 别 信息 
敏感 。 

和 风险 决策 类 似 ， 蜂 期 决策 中 的 评估 模式 差异 
也 是 JE/SE 偏好 反 转 的 一 个 子 类 别 。 在 跨 期 决策 情 
境 中 ,选项 的 类 别 属性 为 有 无 延迟 ,数量 属性 为 时 
间 长 短 。 在 单独 评 佑 时， 有 无 延迟 的 可 评估 性 更 高 ， 
人 们 对 此 较为 敏感 ， 时 间 长 短 的 可 评估 性 较 低 ， 人 
们 对 此 较为 不 敏感 ; 但 是 ,在 联合 评估 时 ， 人 们 对 
两 类 信息 都 较为 敏感 。 
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因此 , 在 涉及 到 跨 期 决策 时 ， 如 果 期 待人 们 更 
耐心 、 更 愿意 延迟 获得 较 大 奖赏 ,那么 政策 制订 者 
应 该 更 多 让 人 们 采用 联合 评估 的 模式 ; 但 是 如 果 需 
要 鼓励 人 们 获得 即时 满足 ,那么 政策 制定 者 可 以 设 
计 单独 评估 的 模式 。 

3.3 Bie 

许多 关于 慈善 捐赠 的 研究 发 现 , 在 单独 评估 时 ， 
人 们 常 出 现 数量 忽略 的 问题 ， Desvousges 等 (1992) 
很 早 就 发 现 了 人 们 对 数量 不 敏感 ， 一 个 经 典 例 子 就 
是 ,在 单独 评估 时 ， 人 们 给 予 两 千 、 两 万 或 者 二 十 
万 只 被 石油 污染 困 住 的 候鸟 的 捐赠 金额 没有 什么 
差异 。 此 外 , 受害 者 识别 效应 的 研究 也 显示 ， 人 们 
会 捐赠 更 多 金钱 给 一 位 受害 者 ,而 不 是 人 数 更 多 的 
一 群 受害 者 (Kogut & Ritov, 2005). X, 数量 忽 上 略 
问题 和 前 文中 提 到 的 关于 违背 占 优 性 原则 的 现象 
非常 相似 ， 正 是 因为 人 们 对 冰激凌 的 大 小 不 够 敏 
感 、 对 棒球 收藏 卡片 数量 的 不 够 敏感 ， 所 以 才 产 生 
了 不 合理 的 决策 。 

根据 广义 可 评估 性 理论 , 在 这 些 情景 中 ， 人 们 
知识 较 少 或 者 缺乏 内 在 参考 系统 (例如 对 于 乌 类 群 
体 的 数量 )， 又 处 于 单独 评估 模式 ， 总 体 处 于 可 评 


理财 方案 最 终 收 益 最 高 )， 人 们 也 有 许多 决策 的 目 
标 是 让 自己 获得 愉快 的 感受 ， 也 就 是 Kahneman, 
Wakker 和 Sarin (1997) 所 提 到 的 ， 让 自身 体验 效用 
最 大 化 。 但 是 , 在 这 个 过 程 中 ， 人 们 却 不 见得 能 准 
确 选 择 。 这 是 因为 : 人 们 预测 或 者 购买 时 往往 处 于 
联合 评估 的 模式 , 但 实际 生活 或 者 使 用 时 处 于 单独 
评估 的 模式 ， 因 此 预测 时 人 们 容易 高 佑 体验 时 的 价 
值 敏感 性 。Hsee 和 Zhang (2004) 将 这 种 过 分 敏感 的 
预测 称 为 区 别 偏差 (distinction bias). 

首先 ,区别 偏差 会 导致 预测 偏差 。 例 如 Dunn, 
Wilson 和 Gilbert (2003) 对 大 学 生 的 调查 发 现 : 新 生 
刚 入 学 时 往往 认为 宿舍 的 特征 会 影响 自己 的 居住 
体验 ， 因 为 刚 申请 宿舍 时 ， 大 学 生 更 接近 联合 评估 
模式 ; 但 是 实际 居住 一 段 时 间 后 调查 发 现 : 宿舍 特 
征 对 于 学 生 居 住 幸 福 感 的 影响 很 小 ,这 是 因为 住 在 
其 中 的 学 生 更 接近 单独 评估 模式 。 

研究 者 发 现 ， 区 别 偏差 导致 的 预测 偏差 有 以 下 
几 种 情形 。 第 一 ， 预 测 者 高 估 了 数量 信息 对 体验 者 
的 影响 。 例 如 : Hsee 和 Zhang (2004) 让 大 学 生 想 象 
自己 出 版 了 一 本 诗集 ， 并且 校 园 书 店 正 在 销售 此 
书 。 联 合 评估 下 ,想象 自己 的 诗集 卖 出 了 0 本 、80 


估 性 较 低 的 情况 ,因此 对 于 数量 和 时 间 都 比较 不 敏 
感 。 根 据 规范 性 解释 ， 人 们 应 该 给 数量 较 多 的 鸟 群 
和 人 数 较 多 的 受害 者 捐款 更 多 , 但 是 由 于 人 们 对 数 
量 不 敏感 ， 做 出 的 捐赠 决策 和 人 数 上 的 实际 需要 不 
相符 合 。 

如 何 增强 我 们 对 数量 的 可 评估 性 ,使 得 人 们 为 
更 多 人 捐款 时 真 的 能 捐助 更 多 呢 ? Hsee, Zhang, Lu 
和 Xu (2013) 提 出 了 一 种 新 方式 : 单位 请 求 (unit 
asking)。 例 如 : ERRENTEN 20 个 低 收入 家 庭 
的 儿童 募 款 ,单位 请 求 的 方式 要 求 捐赠 者 首先 考虑 ， 
“如 果 你 要 帮助 其 中 一 个 儿童 ,请问 你 愿意 捐 多 少 
ER? ”， 然 后 再 回答 , “为 20 位 儿童 捐款 , 请 问 你 愿 
意 捐 多 少 钱 ?”。 

单位 请 求 的 方式 先 简 单 询问 了 一 个 “单位 ”的 
数值 ， 创 造 了 一 种 类 似 联合 评估 的 比较 , 使 得 人 们 
对 较 大 的 数量 有 了 更 准确 的 评估 ， 从 而 提高 了 捐款 
的 总 量 。 因 此 ,如果 数量 信息 是 影响 人 们 明智 决策 
的 重要 因素 , 但 是 普通 人 又 不 具备 相应 的 知识 时 ， 
采用 单位 请 求 这 类 助 推 方式 ， 提 升 该 因素 的 可 评估 
性 ， 形 成像 联合 评价 那样 的 效果 ， 是 一 种 简洁 有 效 
的 做 法 。 
3.4 消费 选择 

现实 生活 中 , 除了 客观 的 决策 结果 (例如 哪个 


本 、160 本 、240 本 ,对 每 种 情况 都 评估 自己 的 感受 
如 何 。 单独 评估 组 的 参与 者 只 看 到 了 四 种 数量 的 其 
中 一 种 , 评估 自己 感受 如 何 。 在 联合 评估 时 ， 人 们 
认为 自己 的 感受 呈现 线性 上 升 的 趋势 , 四 组 之 间 差 
异 显著 。 但 是 单独 评 佑 时， 只 要 有 诗集 卖 出 ， 人们 
就 比 没有 卖 出 诗集 更 加 快乐 , 但 是 具体 是 卖 出 了 多 
少 本 (80 本 、160 本 还 是 240 本 ) 对 情绪 就 不 再 有 影 
响 。 此 外 , Hsee 和 Zhang (2004) 让 参与 者 预测 其 他 
人 阅读 10 个 或 者 25 个 积极 词汇 (或 者 消极 词汇 ) 后 
情绪 如 何 ， 预测 者 处 于 联合 评估 模式 , 认为 词汇 的 
效 价 (积极 或 消极 ) 和 词汇 的 数量 (10 个 还 是 25 个 词 ) 
都 会 影响 阅读 者 的 情绪 。 但 是 由 于 阅读 者 只 阅读 四 
种 列表 中 的 一 种 ， 处 于 单独 评估 模式 ， 他 们 的 情绪 
其 实 只 受到 词汇 效 价 的 影响 ， 而 不 受到 数量 的 影 
响 。 这 与 前 文 提 到 的 评估 模式 和 类 别 - 数 量 信息 的 
交互 作用 是 相 吻 合 的 。 

第 二 ,预测 者 高 佑 了 比较 信息 对 体验 者 的 影 
响 。 例如: Hsee, Shen, Zhang, Chen 和 Zhang (2012) 
考察 了 天 命 注 定 和 自由 竞争 两 种 分 配方 式 下 人 们 
的 感受 如 何 。 预测 者 认为 自由 竞争 组 的 人 们 会 感觉 
更 公平 ; 但 是 在 实际 体验 者 (只 处 于 一 种 条 件 ) 中 ， 
天 命 注 定 组 和 自由 竞争 组 的 公平 感 并 没有 差异 。 体 
验 者 在 单独 评估 的 条 件 下 ， 判 断 公平 的 参照 信息 较 
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少 ， 对 公平 的 敏感 程度 并 没有 预测 者 想象 的 那么 
高 。 类 似 的 ，Cooney，Gilbert 和 Wilson (2016) 也 发 
W: 分 配 者 认为 分 配 过 程 的 公平 性 很 重要 , 但 是 被 
分 配 者 其 实 并 没有 那么 重视 过 程 。 

1 于 人 们 在 联合 评估 时 会 错误 预测 自身 感受 ， 
预测 偏差 也 会 导致 实际 的 选择 偏差 , 使 得 人 们 去 选 
择 那 些 并 不 能 使 自己 最 愉快 的 选项 。 

第 一 类 选择 偏差 表现 在 : 人 们 在 选择 时 注重 数 
量 差 异 ， 忽 视 类 别 差异 , 但 是 在 体验 时 更 多 受到 类 
别 差 异 的 影响 。 例 如 : Hsee 和 Zhang (2004) 让 人 们 
在 两 种 任务 间 决 策 : 讲 一 个 自己 失败 的 故事 并 获得 
15 克 巧 克 力 ， 或 者 讲 一 个 自己 成 功 的 故事 并 能 获 
得 5 克 巧 克 力 。 为 了 获得 更 大 块 的 巧克力 ， 大 部 分 
人 都 愿意 选择 去 讲 失败 的 故事 。 但 是 单独 体验 这 两 
种 不 同 任务 时 , 讲 成 功 故事 获得 少量 巧克力 的 参与 
者 更 开心 。 因 为 巧克力 的 多 少 是 数量 信息 , 体验 者 
处 于 单独 评估 模式 ， 大 块 或 者 小 块 的 巧克力 影响 不 
大 ; 但 是 讲述 失败 或 成 功 故 事 带 来 的 难过 或 愉快 体 
验 却 有 很 大 影响 。 

第 二 类 选择 偏差 表现 在 : 在 选择 时 , 个 体 更 注 
重 外 在 可 比较 的 信息 ,忽略 了 内 在 可 评估 的 属性 ， 
但 在 体验 时 , 个 体 却 更 多 受到 内 在 可 评估 属性 的 影 
响 。 例 如 : 前 文 提 到 的 电子 相框 的 选择 (Yang et al., 
2011)， 联 合 评估 时 ， 人 们 更 多 选择 难看 但 分 辩 率 
高 的 相框 ， 但 是 ,让 人 们 实际 体验 时 ， 反 而 是 分 辩 
率 低 但 是 好 看 的 相框 让 人 们 体验 更 好 ， 因 为 单独 摆 
放 在 家 里 时 ， 分 辨 率 的 差异 是 内 在 难以 评估 的 ， 外 
观 美 丑 却 是 内 在 容易 评估 的 。 

因此 ,可 以 看 到 ,联合 评估 固然 能 促进 人们 更 
为 耐心 、 更 合理 地 进行 慈善 捐赠 , 但 这 不 代表 联合 
评估 总 是 能 帮助 人 们 做 出 好 的 决策 。 要 减弱 区 别 偏 
差 的 影响 ,使 得 消费 者 选择 到 使 自己 体验 效用 最 大 
化 的 选项 ,消费 者 需要 在 预测 或 选择 阶段 就 采用 单 
独 评估 模式 , 最 直接 的 方式 就 是 ， 让 选项 单独 出 现 
在 消费 者 面前 , 但 是 这 种 做 法 在 现实 中 实行 难度 较 
高 ， 其 他 更 可 行 的 方式 还 有 两 种 。 

第 一 ,“ 半 单独 评估 ?法 ,也 就 是 说 ， 消 费 者 可 
以 每 次 单独 地 观察 一 个 选项 ,间隔 一 段 时 间 后 再 去 
评估 其 他 选项 。Yang 等 (20110) 对 比 了 “ 半 单 独 评估 ” 
和 联合 评估 的 决策 差异 。 在 联合 评估 下 , 参与 者 多 
数 选择 外 观 丑陋 但 分 辩 率 高 的 相框 , 但 是 他 们 的 体 
验 却 并 不 美好 ; 在 半 单 独 评估 模式 下 , 参与 者 先 观 
看 一 个 相框 , 间隔 10 分 钟 后 ， 再 去 观看 另 一 个 相框 ， 
然后 再 作出 选择 ,这 种 情况 下 ,更 多 的 参与 者 选择 


了 分 辨 率 低 但 是 外 观 漂亮 的 相 杠 ,也 就 是 令 人 体验 
更 愉悦 的 相框 。 因 此 ， 这 种 方式 可 以 降低 区 别 偏差 
带 来 的 选择 偏差 。 

第 二 ,弱化 技术 参数 。 同 样 是 上 文中 的 选 相框 
实验 ， 如 果 研 究 者 不 告知 参与 者 关于 分 状 率 的 信息 ， 
大 部 分 参与 者 在 仔细 观察 后 会 选择 外 观 漂亮 的 相 
框 (Yang et al.，2011)， 即 在 体验 阶段 令 消 费 者 更 愉 
快 的 那个 选项 。 当 然 , 许多 商家 希望 向 消费 者 提供 
更 多 、 更 准确 的 信息 , 但 是 ， 如 果 一 个 消费 决策 的 
最 终 目 的 是 拥有 更 愉快 的 感受 ， 那么 弱化 技术 参数 
等 数字 的 影响 , 让 消费 者 听从 自己 的 体验 和 实际 感 
受 , 可 能 是 一 个 更 好 的 选择 。 
3.5 ”商业 定价 

区 别 偏差 并 不 仅仅 会 导致 个 体 做 出 不 符合 自 
身体 验 效 用 最 大 化 的 选择 , 其 至 有 可 能 导致 商业 决 
策 中 的 错误 ,使 得 决策 者 无 法 实现 经 济 利润 的 最 
大 化 。 

Shen, Hsee, Wu 和 Tsai (2012) 提 出 ,定价 者 一 
般 处 于 联合 评估 模式 , 会 考虑 到 多 种 参考 产品 的 价 
格 来 确定 产品 定价 , 但 是 购买 者 往往 只 看 到 这 个 产 
品 的 价格 ， 处 于 单独 评估 模式 。 当 购买 者 对 其 他 参 
考 产 品 的 价格 有 所 了 人 解 时 ,一 般 不 存在 定价 偏差 的 
问题 ， 因 为 定价 者 和 购买 者 都 处 于 联合 评估 模式 。 
但 是 ， 当 某 种 产品 比较 独特 或 者 陌生 时 ， 就 有 可 能 
存在 定价 偏差 一 一 定价 者 处 于 联合 评估 模式 ,购买 
者 处 于 单独 评估 模式 ,定价 者 很 可 能 高 佑 购买 者 的 
价格 敏感 性 ， 定价 偏 低 ， 未 能 实现 利润 最 大 化 的 
目标 。 

为 了 验证 定价 者 和 购买 者 处 于 不 同 的 评估 模 
xt, Shen 等 (2012) 让 具有 多 年 工作 经 验 的 MBA 学 
生 扮 演 定 价 者 和 购买 者 。 定价 者 需要 对 一 个 可 以 识 
别 情绪 的 新 型 相机 定价 , 目标 是 最 大 化 营业 额 ( 即 
二 品 售 价 乘 以 售 出 数量 )。 在 定价 结束 后 ,报告 自己 
的 思考 过 程 : 是 仅仅 思考 了 一 个 最 有 利润 的 价格 
(单独 评估 ) 还 是 思考 了 一 系列 价格 后 选择 了 其 一 
(联合 评估 )。 购买 者 被 告知 该 相机 以 3000 人 民 币 的 
价格 出 售 ， 请 决定 是 否 愿 意 购 买 ， 随 后 报告 自己 的 
思考 过 程 ， 是 仅仅 思考 了 在 该 价格 下 是 否 愿意 购买 
(单独 评估 ) 还 是 考虑 了 其 他 可 能 的 价格 (联合 评 
估 )。 结 果 发 现 : 定价 者 的 确 比 购买 者 更 多 处 于 联 
合 评估 模式， 而且 ,联合 评估 模式 下 的 定价 者 制定 
出 的 价格 显著 低 于 单独 评估 模式 下 的 定价 者 。 

为 了 进一步 说 明定 价 者 处 于 联合 评估 模式 下 
时 会 产生 定价 误差 ， Shen 等 (2012) 招 募 了 另 一 批 
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MBA 学 生 进 行 一 个 定价 购买 游戏 。 对 定价 者 而 言 ， 
他 们 要 为 一 个 业余 摄影 家 的 艺术 照片 定价 ， 以 获得 
最 高 利润 。 为 简化 任务 , 研究 者 免费 给 他 们 提供 照 
Ar, FR MAA; 其 次 , 他 们 有 50 份 照 片 , 将 要 
以 同样 的 价格 出 售 给 50 名 和 他 们 类 似 的 MBA, 50 
位 购买 者 每 人 单独 决定 自己 是 和 否 购买 1 张 ; 未 售 出 
的 照片 将 作废 ,价值 为 零 。 定 价 者 被 随机 分 为 控制 
组 、 单 独 评估 组 、 联 合 评估 组 。 结 果 发 现 : 单独 评 
佑 组 的 定价 者 制定 的 价格 (中 位 数 50 元 ) 要 显著 高 
于 联合 评估 组 和 控制 组 (这 两 组 中 位 数 都 是 20 元 )。 
根据 定价 者 的 定价 结果 , 研究 者 设置 了 高 价 组 (每 
张 照片 50 元 ) 和 低 价 组 (每 张 照 片 20 50), 购买 者 被 
随机 分 配 到 其 中 一 种 情况 , 决定 自己 是 否 购 买 一 张 
艺术 照片 。 结 果 发 现 : 对 于 购买 者 而 言 ， 高 价 还 是 
低 价 并 没有 影响 购买 者 的 比例 。 综 合 而 言 ， 单独 评 
估 的 定价 者 制定 的 价格 才 是 利润 最 大 化 的 价格 。 

因此 ， 当 产品 比较 独特 或 者 陌生 时 ,定价 者 采 
用 联合 评估 模式 下 制定 的 价格 可 能 会 有 所 偏差 ， 定 
价 者 很 可 能 高 估 处 于 单独 评估 模式 下 的 购买 者 的 
价格 敏感 性 ,定价 偏 低 ， 未 能 实现 利润 最 大 化 的 目 
标 。 在 这 时 候 ， 商 业 机 构 应 该 考虑 重新 审视 自己 的 
定价 策略 ,让 决策 者 们 在 单独 评估 的 模式 下 思考 ， 
或 者 在 对 消费 者 进行 市 场 调研 时 采取 单独 评估 的 
调查 策略 ， 更 有 可 能 获取 合理 的 参考 定价 。 
3.6 ”幸福 感 

正如 前 文 所 述 , 很 多 时 候 ， 人 类 不 能 准确 地 判 
WTA A FEA ARSE HU. 我 们 以 为 重要 的 
居住 环境 (Dunn et al., 2003)、 分 配方 式 (Hsee et al., 
2012), 经 济 收入 (Kahneman & Deaton, 2010) 等 因素 
可 能 并 不 像 我 们 想象 地 那样 带 来 愉快 的 体验 和 感 
受 。 人 们 的 幸福 到 底 是 来 源 于 哪些 因素 ， 是 社会 比 
较 让 我 们 更 满足 吗 ? 通过 一 项 跨 城 市 的 幸福 感 调 
查 , Hsee, Yang, Li 和 Shen (2009) 分 析 了 这 一 问题 。 

研究 者 对 中 国 31 个 城市 的 居民 进行 了 一 次 电 
话 调查 , 调查 者 询问 了 参与 人 的 室内 温度 (调查 在 
冬季 进行 )、 拥 有 珠宝 的 价值 以 及 对 这 两 个 方面 的 
满意 程度 。 结 果 发 现 : 珠宝 的 价值 对 于 幸福 感 的 影 
响 只 存在 相对 效应 (本 城内 珠宝 越 贵 越 幸 福 )， 而 不 
存在 绝对 效应 (珠宝 的 绝对 价值 对 幸福 感 没 有 影响 ); 
但 是 室内 温度 对 于 幸福 感 的 影响 却 存 在 绝对 效应 ， 
冬季 室内 温度 的 绝对 高 低 对 于 幸福 感 有 显著 影响 ， 
室温 越 高 ， 幸 福 感 越 强 ， 路 城市 的 效应 仍然 显著 
(如 图 4 所 示 )。 

可 能 的 原因 是 : 人 们 对 珠宝 没有 内 在 的 评估 系 


A: Scatter Plot of the 31 Cities Based on the Temperature Data 
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B: Scatter Plot of the 31 Cities Based on the Jewelry Data 
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图 4 室内 温度 和 珠宝 对 幸福 感 的 影响 
(资料 来 源 : Hsee et al, 2009) 


统 ， 进 行 判断 时 , 城市 内 的 社会 比较 信息 可 得 性 高 ， 
在 城市 内 部 接近 联合 评估 模式 ， 因 此 珠宝 的 相对 价 
值 对 幸福 感 有 影响 ; 但 是 一 旦 扩大 到 城市 外 ,社会 
比较 信息 可 得 性 较 低 , 在 城市 之 间接 近 单 独 评估 模 
式 , 珠宝 价值 就 影响 很 小 了 。 相 反 ， 人 类 对 于 舒适 
温度 有 着 内 在 的 参照 系统 ， 即 使 人 们 处 于 不 同城 市 ， 
没有 其 他 地 区 的 室温 进行 社会 比较 , 接近 单独 评估 
模式 , 室内 温度 仍然 是 可 评估 性 较 高 的 属性 ,在 跨 
城市 的 层面 上 ,温度 对 幸福 感 仍 有 显著 影响 。 

也 就 是 说 : 内 在 可 评估 性 高 的 因素 对 于 幸福 感 
的 影响 是 绝对 的 , 不 依赖 于 社会 比较 信息 或 者 其 他 
外 部 参考 信息 。 比 如 关于 食物 品尝 的 研究 发 现 : 
无 论 旁边 放 的 是 更 美味 的 巧克力 还 是 更 难 吃 的 沙 
TË, 人 们 在 品尝 暮 条 时 的 实际 感受 并 没有 什么 差 
异 ， 因 为 我 们 沉浸 在 暮 条 的 味道 中 时 ， 并 不 会 过 多 
思考 其 他 食品 (Gilbert & Wilson, 2009)。 

Tu 和 Hsee (2016) 还 提出 内 在 可 评估 性 高 的 因 
素 也 更 少 受 到 享乐 适应 的 影响 。 内 在 可 评估 性 低 的 
因素 提升 后 ， 过 一 段 时 间 , 我 们 就 产生 了 享乐 适应 ， 
这 种 变化 就 不 再 影响 我 们 的 幸福 感 了 。 例 如 : 从 1 
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克拉 的 钻石 换 成 2 SEAS, JL Aa, “ease 


实验 室 走 到 现实 中 去 , 考虑 单独 和 联合 评估 这 一 领 


感 就 消退 了 ， 因 为 变化 后 时 间 越 和 久 , 个 体 的 评估 模 
式 越 接近 单独 评估 , 没有 1 克拉 的 鲜明 比较 ,2 克拉 
钻石 的 可 评估 性 降低 了 。 但 是 ， 内 在 可 评估 性 高 的 
因素 却 不 会 如 此 , 例如 : 室内 温度 、 洗 澡 水 温度 等 
方面 的 变化 ,即使 没有 了 过 去 的 寒冷 作为 对 照 ,我 
们 也 仍然 对 温度 是 否 舒 适 非常 敏感 。 因 此 , 在 提升 
幸福 感 的 决策 中 ,更 为 智慧 的 做 法 是 去 提升 那些 内 
在 可 感知 的 因素 , 例如 添置 暧 风 空调 、 品 尝 美 味 食 
物 等 比 购买 珠宝 能 带 来 更 加 长 久 的 幸福 感 。 

综 上 , 单独 评估 和 联合 评估 能 深刻 影响 人 们 的 
风险 偏好 、 跨 期 选择 、 消 费 体 验 等 多 方面 判断 和 决 
策 。 政策 制定 者 可 以 基于 决策 情景 和 决策 目标 的 差 
异 , 采用 不 同 的 选择 结构 来 助 推 人 们 做 出 适合 的 选 
择 。 当 决策 有 清晰 的 外 部 目标 , 需要 人 们 对 风险 更 
为 中 性 、 更 有 耐心 可 延迟 满足 、 对 数量 信息 的 变化 
更 为 敏感 时 ， 宜 采用 联合 评估 。 即 使 在 决策 情境 难 
以 实现 联合 评估 时 ,可 以 设立 参照 点 (例如 单位 请 
求法 ), 或 者 将 数量 信息 转化 为 类 别 信息 ,来 助 推 
人 们 的 决策 。 反 之 ， 当 决策 目标 是 提升 个 体 的 体验 
幸福 时 ， 宜 采用 单独 评估 ,可 以 通过 半 单 独 评 佑 、 
减少 数量 信息 等 方式 , 来 避免 人 们 进行 直接 的 比较 ， 
获得 更 愉快 的 体验 。 


4 ”结论 和 展望 


正如 渴望 成 功 的 开发 商 不 会 选择 众所周知 、 开 
发 完善 的 地 段 ， 而 会 寻找 被 众人 所 忽视 的 潜力 地 
段 。 如 果 一 位 学 者 希望 做 出 富有 影响 力 的 研究 , 那 
么 他 /她 也 不 应 再 进入 那些 研究 已 经 非常 充足 的 红 
海 领域 ,而 应 去 寻找 那些 富有 潜力 的 新 领域 。 我 们 
认为 ,评估 模式 (单独 评估 与 联合 评估 ) 的 研究 正 是 
一 支 潜力 股 , 存在 多 种 的 探索 方向 。 

相 比 于 其 他 的 变量 ,单独 和 联合 评估 这 一 变量 
在 现实 中 可 以 简洁 有 效 地 进行 操纵 , 方便 进行 现场 
Ko Newman, Howlett 和 Burton (2016) 关 于 标签 
的 研究 给 了 一 个 很 好 的 演示 : 在 单独 评估 的 状态 下 ， 
除了 客观 的 线索 ,增加 一 些 主观 评估 的 标签 能 帮助 
消费 者 更 流畅 的 决策 ， 甚 至 做 出 更 好 的 决策 。 例 如 
在 速 食 食品 上 , 根据 其 营养 成 分 表 , 研究 者 增加 了 
一 个 主观 标签 “健康 星 级 ”。 相 比 于 没有 健康 星 级 标 
签 的 组 ,呈现 了 健康 星 级 组 的 参与 者 选择 健康 食品 
的 概率 从 48% 提 升 至 了 74%。 通过 组 织 选 项 的 呈现 
方式 (单独 或 者 联合 呈现 ), 单独 评估 和 联合 评估 非 
稼 容易 进行 操纵 。 如 果 人 研究 者 有 志 于 让 决策 研究 从 


域 可 能 是 一 个 较为 可 行 的 选择 。 

在 本 文中 , 我 们 回顾 了 单独 评估 和 联合 评 佑 带 
来 的 偏好 反 转 现象 ， 在 许多 重要 的 领域 中 , 无论 是 
人 事 招聘 、 消 费 选 择 、 政 策 评估 、 道 德 判断 、 风 险 
和 器 期 决策 等 , 评估 模式 都 影响 了 人 们 的 判断 和 决 
策 。 广 义 可 评估 性 理论 对 JE/SE 偏好 反 转 的 成 因 进 
行 了 解释 。 评 估 模 式 也 可 以 在 风险 和 蜂 期 决策 、 莹 
善 捐 赠 、 个 体 消费 选择 、 商 业 定价 等 各 个 领域 助 推 
明智 的 决策 。 我 们 认为 : 两 种 评估 模式 是 一 种 简洁 
并 且 有 影响 力 的 因素 , 而且 这 方面 的 研究 还 充满 了 
新 的 机 遇 和 空间 ,未 来 研究 者 会 不 断 发 现 新 的 现象 ， 
探索 更 多 的 现实 应 用 。 
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Abstract 

Evaluation mode is an important yet under-studied aspect of decision-making. All decisions are made in 
one of two evaluation modes or some mix of the two. One is joint evaluation (JE), in which different options are 
presented together and evaluated simultaneously. The other is single evaluation (SE), in which different options 
are presented separately, and each option is evaluated in isolation. 

This article reviews existing literature on how JE and SE can lead to reversed preferences, with one option 
favored in JE and another option favored in SE, in domains including hiring, consumer choice, moral judgments 
and healthcare decisions. For example, in JE, a plain-looking but experienced job candidate would be favored 
over a good-looking but less-experienced job candidate, but in SE, the good-looking but less experienced 
candidate would be favored. 

We also review existing research on the “less is better” phenomenon-that in SE (but not in JE), a 
normatively less valuable option is judged more favorably than its more valuable alternative. For example, in SE 
(but not in JE), 7 oz. of ice cream served in a 5-oz. cup is valued more favorably than 8 oz. of ice cream served 
in a 10-oz. cup. 

To interpret JE/SE preference reversals and the less-is-better effect, several explanations have been 
proposed, such as a want/should conflict, a within-category versus between-category comparison, the option as 
information model, and the dual-process model. The present review focuses on the general evaluability theory 
(GET), which ascribes JE/SE preference reversals and the less-is-better effect to attribute evaluability. 
According to GET, the evaluability of an attribute depends conjunctively on three factors: evaluation mode (JE 
versus SE), knowledge of the decision-maker about the attribute, and the inherent/learned nature of the attribute. 
Not only can GET explain JE/SE preference reversals and the less-is-better effect, it also explains many other 
effects, such as scope neglect, differences in risk preference between JE and SE, differences in time preference 
between JE and SE, misprediction of future hedonic experiences, and so on. 

Understanding JE-SE differences and attribute evaluability also offers insight into how to improve 
decisions in contexts such as fundraising, pricing strategy, public service, and subjective well-being. 

The review suggests that evaluation mode (JE versus SE) is an important independent variable that 
influences a wide range of decisions in counterintuitive ways and thereby provides opportunities to design 
choice-architecture-based nudges to improve decisions. Yet despite its importance, evaluation mode has not been 
well-studied and therefore is a fertile ground for researchers to explore and develop. 

Key words evaluation mode; preference reversal; general evaluability theory; dual-process model; nudge 


